A 'Silent Trial' Assessing the Accuracy of Large Language Models for Assisting Community Health Workers in Low-Resource Settings
Eine Studie in Ruanda zeigt, dass zwar Community Health Workers eine hohe Genauigkeit bei Überweisungsentscheidungen erreichen, während das KI-Modell o3 von OpenAI vergleichbar gut abschneidet, Gemini 2.5-Flash jedoch versagt, was darauf hindeutet, dass LLMs in etablierten Programmen derzeit nur einen begrenzten Mehrwert bieten, aber die Modellwahl entscheidend ist.
Shimelash, N., Rutunda, S., Menon, V., Emmanual-Fabula, M., Uwimbabazi, A., Rugege, C., Nshimiyimana, C., Rwema, I., Kandekwe, M., Berhe, D. F. D., Wong, R., Remera, E., Hezagira, E., Gill, J., Archer (…)2026-02-17📄 primary care research